from spark_utils import SparkSessionManager
"""
    用于读取gaussdb数据的脚本
"""
spark = SparkSessionManager.get_spark_session()


# GaussDB连接配置信息
jdbc_url = "jdbc:postgresql://${gasuss_host}:${port}/db_all_userbase?currentSchema=db_pyspark"
properties = {
    "user": "${gauss_user}",
    "password": "${gauss_pwd}",
    "driver": "org.postgresql.Driver"
}
# 高斯数据库一般可使用PostgreSQL的JDBC驱动，根据实际调整
# 参考华为官方文档 https://support.huaweicloud.com/mgtg-dws/dws_01_0032.html
# 要读取的表名
table_name = "stu"

# 从GaussDB读取数据到DataFrame
df = spark.read.jdbc(url=jdbc_url, table=table_name, properties=properties)
# 展示读取到的数据（查看部分数据示例）
df.show()

# 关闭SparkSession
spark.stop()
